AI资讯新闻榜单内容搜索-Claude 3.5

沃顿商学院已发布4篇「Prompt」报告｜重磅

宾夕法尼亚大学沃顿商学院（The Wharton School）今年发布了一系列名为《Prompting Science Reports》的重磅研究报告。他们选取了2024-2025最常用的模型（如GPT-4o, Claude 3.5 Sonnet, Gemini Pro/Flash等），在极高难度的博士级基准测试（GPQA Diamond）上进行了数万次的严谨测试。

来自主题: AI技术研报

9624 点击 2025-12-10 16:11

Ilya刚预言完，世界首个原生多模态架构NEO就来了：视觉和语言彻底被焊死

全球首个可大规模落地的开源原生多模态架构（Native VLM），名曰NEO。要知道，此前主流的多模态大模型，例如我们熟悉的GPT-4V、Claude 3.5等，它们的底层逻辑本质上其实玩的就是拼接。

来自主题: AI技术研报

9437 点击 2025-12-05 14:46

开发者生产力“平替”？MiniMax M2全面测评：代码、速度与迁移成本

生成式AI技术的成熟，让智能编程逐渐成为众多开发者的日常，然而一个大模型API选型的“不可能三角”又随之而来：追求顶级、高速的智能（如GPT-4o/Claude 3.5），就必须接受高昂的调用成本；追求低成本，又往往要在性能和稳定性上做出妥协。开发者“既要又要”的正义，谁能给？

来自主题: AI产品测评

11804 点击 2025-11-05 10:25

超越Claude 3.5和o1！8B模型靠「分层投票+测试时训练」逆袭

小时候完成月考测试后，老师会通过讲解考试卷中吃错题让同学们在未来取得好成绩。

来自主题: AI技术研报

9799 点击 2025-07-23 10:20

天塌了，Claude 全面断供Windsurf！CEO喊冤控诉也挡不住开发者退订，祸起OpenAI收购？

当地时间 6 月 4 日，Windsurf CEO Varun Mohan 发帖称，在提前不到五天的通知时间里，Anthropic 切断了其几乎所有 Claude 3.x 模型的直接访问权限（first-party capacity），包括 Claude 3.5 Sonnet、3.7 Sonnet 和 3.7 Sonnet Thinking。

来自主题: AI资讯

8887 点击 2025-06-04 16:36